本报讯(记者 张王君)经过三年的沉寂之后,北京中文之星数码科技公司进行了公司重组,近日亮出了进军智能科技市场的杀手锏:潜心三年研究开发成功的中文之星CLM(中文语言模型)技术。
总裁张一方告诉记者,中文之星将正式从原来的新天地电子信息技术研究所以及方正新天地软件公司脱离,组建成立北京中文之星数码科技有限公司,全面继承中文之星的品牌和技术,今后将以中文智能处理研究与应用作为公司长期的发展战略,专门从事智能软件应用和智能网络服务方面的开发,并吸纳风险投资的介入,准备在中文智能信息处理领域一展身手。
该公司即将推出的基于CLM(中文语言模型)技术的达尔文智能拼音输入法,与传统输入法相比,最大的特点是能够进行整句输入,输入的平均准确率将达到95%左右。用户只要连续输入完整的汉语拼音,即可完成中文录入,不用再为不时停顿选词而烦恼。
中文之星达尔文智能拼音输入法的背后有一个庞大的CLM数据库支持,用户输入整句话的拼音后,数据库会计算出词语之间的相互关系,自动选择最合适的匹配,组成符合用户输入原意的词句。表现在输入条上,用户就会看见字、词会随着输入的拼音不断增多而不断地跳跃变换,输入的信息越多,其准确性也越高,所以它特别适合普通人的写作思维习惯,对外国人学习汉语也有极大帮助。
由于该输入法在后台计算上,采用了现代生物数学算法,对100亿字规模的语言材料进行了详尽的分析,再加上用户词库的动态调整,以及适合各种双拼方案及容错能力,所以在使用上能够达到使用者“随心所欲”的要求,具备自学习、自适应和智能化的特点,这也就是为什么采用生物进化论鼻祖“达尔文”的名字来命名该软件的原因。
微软中国研究院院长李开复博士曾在一篇文章中谈到:中国有2000万人在用电脑,按每个人平均一天半小时输入时间来计算,如果能把输入速度提高一倍,1年就可以节省10亿小时。达尔文智能拼音输入法与传统拼音输入法相比,至少能提高30%的输入速度。